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数字 人 文 研究 领域 的 知识 图 谱 构 建 与 分 析 ” 
一 一 基于 WoS 文献 关键 词 和 引文 上 下 文 的 实证 
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摘要 : [目的 /意义 ] 引文 是 施 引 文献 与 被 引 成 果 的 纽带 ,反映 了 后 继 者 的 借鉴 和 肯定 。 本 研究 在 传统 题 录 
关键 词 网 络 的 基础 上 ,创新 地 将 引文 上 下 文 关键 词 作为 研究 材料 ,所 构建 知识 图 谱 不 仅 能 揭示 文献 主题 的 深层 
次 信息 ,也 能 够 反映 受众 主观 第 选 和 利用 文献 的 知识 过 程 。[ 方法/ 过程 ] 选 取 数 字 人 文 为 研究 领域 ,获取 3 个 
文献 集 和 两 个 引文 文本 集 ,构建 两 个 无 向 的 关键 词 共 现 网 络 和 两 个 有 向 的 基于 文献 引证 的 关键 词 网 络 。 通 过 
共 现 网 络 , 观 察 数字 人 文 领域 知识 的 吸收 与 扩散 ;通过 引证 关键 词 网 络 ,观察 数字 人 文 的 形成 与 转化 。[ 结果 / 
结论 ] 研 究 揭 示 数 字 人 文 的 研究 重点 、 核 心 领 域 与 核心 技术 ,从 受众 的 角度 为 数字 人 文 领域 未 来 研究 提供 借鉴 


do. 
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数字 人 文 引文 上 下 文 关键 词 网 络 TAE 


在 图 情 领域 ,知识 图 谱 被 定义 为 显示 科学 知识 发 
尾 湖 程 与 结构 关系 ,有 助 于 知识 发 现 的 领域 知识 地 图 ， 
是 薪 既 定 主题 下 的 抽象 科学 信息 映射 人 空间 结构 和 图 
JEEP RE REHLIEZ TS 。 知 识 网 络 能 够 实现 知识 的 
创 姥 与 传递 ,特别 是 对 于 领域 知识 网 络 ,能 反映 出 一 个 
领 局 内 部 知识 的 流动 与 传播 。 但 在 传统 知识 网 络 研究 
中 5 藉 多 基于 标题 .摘要 关键 词 等 具有 作者 主观 性 的 
信息 所 构建 ,反映 了 从 创作 者 角度 传递 出 的 知识 信息 ， 
无 法 反映 出 受众 角度 所 获得 的 真正 信息 。 对 受众 主动 
阅读 、 筛 选 .取舍 .利用 的 引文 文本 进行 研究 ,能 够 挖 据 
出 在 显 性 信息 中 难以 发 现 的 潜在 知识 ,充分 发 挥 出 引 
用 内 容 的 价值 和 作用 。 

数字 人 文 的 前 身 是 人 文 计算 。 人 文 计 算 侧 重 计 
算 机 学 科 在 传统 人 文学 科 的 应 用 中 ,但 随 着 信息 时 代 
的 到 来 和 数字 技术 的 普及 ,人 文学 者 借助 数字 思维 来 
解决 人 文 问题 的 动机 在 逐渐 增强 ,研究 的 落脚 点 逐渐 
从 狭义 的 计算 思维 转向 含义 丰富 的 数字 化 ,从 组 织 方 
法 创新 转向 人 文 内 容 本 身 , 故 而 引申 出 数字 人 文 的 概 


念 。 数 字 人 文 作为 新 兴 领 域 ,概念 内 涵 也 在 不 断 演变 。 
知识 图 谱 既 是 数字 人 文 的 实现 手段 之 一 ,也 是 数字 人 
文 领域 研究 脉络 梳理 的 重要 方法 之 一 。 

本 文 以 数字 人 文 研究 领域 为 对 象 , 结 合共 现 网 络 
与 引证 网 络 ,构建 数字 人 文 领域 的 知识 网 络 ,创新 性 地 
将 引文 文本 中 提取 出 的 关键 词 作为 网 络 节 点 ,来 构建 
引用 关系 网 络 。 从 显 性 信息 深入 到 隐 性 信息 ,赋予 原 
有 引证 网 络 更 丰富 的 资料 内 容 , 有 利于 发 现 数字 人 文 
领域 内 的 潜在 关联 。 从 知识 扩散 和 知识 吸收 两 个 视 
角 ,梳理 数字 人 文 知 识 网 络 的 演变 路 径 , 有 助 于 把 握 数 
字 人 文 领域 未 来 的 发 展 之 路 。 


科学 知识 图 谱 , 即 科学 计量 学 的 知识 图 谱 概念 ” 。 
在 知识 网 络 预测 中 ,通过 研究 由 分 离 集 形 成 的 引证 网 
络 合作 网 络 或 二 分 网 络 ,能 够 对 知识 单元 的 联系 进行 
识别 ”。 科 学 知识 图 谱 被 广泛 应 用 于 科学 信息 与 知识 
的 生产 、 展 示 与 传播 。 

在 本 研究 所 切入 的 词 层面 上 ,当前 学 者 主要 是 利 
用 现 有 的 作者 所 标注 的 文献 关键 词 ,进一步 进行 共 现 、 
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量 单位 的 常规 方法 进行 比较 ,发 现 以 关键 词 为 计量 单 
位 能 得 到 更 为 直观 清晰 的 研究 内 容 ”。 关 键 词 除了 与 
内 容 关联 更 密切 ,还 能 反映 知识 的 吸收 与 扩散 作用 , 张 
玲玲 等 通过 提炼 文献 主题 关键 词 ,梳理 了 知识 的 扩散 
方向 与 脉络 ” 。 罗 双 玲 等 认为 引文 关键 词 的 集聚 形成 
了 社区 结构 , 并 称 高 频 标 题 关 键 词 网 络 为 “主题 社 
gm, 

施 引 是 受众 阅读 原始 文献 之 后 , 主动 发 生 的 引用 
行为 。 引 文 是 施 引 者 归纳 被 引文 献 主题 所 形成 的 文 
本 。 引 文 上 下 文 作为 其 延伸 部 分 ,能 够 揭示 被 引文 献 
更 深层 次 的 内 容 , 故 而 具有 一 定 的 研究 价值 "。 引 文 
SF 文 是 后 继 研 究 者 对 被 引 成 果 的 借鉴 和 肯定 ,是 施 
引 挛 献 和 被 引文 献 通过 认 知 建立 起 的 关系 。Y，Liu 等 
在 知识 融合 和 扩散 的 框架 体系 里 ,表明 文章 用 词 和 引文 


的 锡 章 用 词 都 反映 了 知识 融合 的 影响 作用 。 目 前 利 
用 缠 文 上 下 文 进行 网 络 分 析 的 研究 较 少 ,L. Bommann 等 
忆 人 为 研究 对 象 ,对 计量 学 家 下 . Garfield 的 相关 引文 的 
SB 文本 进行 共 现 网 络 分 析 , 发 现 引文 上 下 文 比 施 引 文 
示 题 和 摘要 更 能 反映 被 引文 献 的 内 容 ""。 


在 开放 式 创新 的 大 格局 下 ,国内 外 网 络 绘制 相关 


由 的 大 量 兴起 ,促进 了 知识 图 谱 的 研究 路 线 不 断 被 
与 拓展 ,其 中 陈 超 美 团队 基于 JAVA 语言 开发 的 
(Space 软件 在 国内 最 负 盛名 !” 。 利 用 该 工具 , 肖 明 
将 0CiteSpace 相关 文献 关键 词 机 构 、 作 者 .期 刊 等 基本 
科 堂 信息 构建 网 络 图 谱 ,然而 仅仅 停留 在 显 性 信息 的 
分 术 上 "" 。 国 内 外 利用 知识 网 络 方法 ,主要 对 不 同 的 
领域 ,尤其 是 新 兴 领 域 ,进行 研究 脉络 的 梳理 与 热点 控 
测 - 中 ,数字 人 文 即 是 其 中 一 个 重要 应 用 方向 。 
数字 人 文 的 发 展 离 不 开 其 所 处 的 时 代 背 景 ,并 逐 
渐 为 人 文学 科研 究 带 来 了 质 的 变革 。S，Schreibman 等 
梳理 归纳 了 数字 人 文 早期 的 研究 历史 ,覆盖 了 考古 . 美 
术 . 文 学 .音乐 .表演 ,多 媒体 等 领域 "1。 数 字 人 文 的 
研究 内 容 也 在 不 断 丰富 ,其 内 涵 从 人 文 计算 延伸 到 数 
据 存储 数据 组 织 .可 视 化 分 析 等 数字 技术 相关 的 方 方 
面 面 ,如 D. Cooper 等 提取 并 编码 地 名 或 空间 相关 的 文 
字 内 容 ,使 之 以 地 图 形式 呈现 SU. Hinrichs 等 构建 
了 科幻 小 说 的 物件 . 词 云 ,符号 .时 间 线 的 合集 ,并 将 其 
"LIEU 。 图 书馆 人 和 信息 科学 学 者 作为 数字 人 文 
的 核心 贡献 者 ,在 教学 服务 .凝聚 用 户 . 人 才 培 养 .资源 
建设 方面 都 有 所 贡献 。 
在 数字 人 文 研究 成 果 梳理 方面 ,并 不 乏 采 用 科学 


知识 图 谱 进 行 研 究 的 文献 。 得 益 于 CiteSpace 等 有 效 
的 工具 ,国内 学 者 是 该 研究 思路 的 主力 军 :主要 通过 文 
献 的 共 现 网 络 或 引证 关系 归纳 数字 人 文 研究 的 热点 领 
域 ,并 前 析 数 字 人 文 研究 的 演化 路 径 ”-” ,该 方法 在 
际 层面 也 逐渐 得 到 认可 。 然 而 ,这 类 文章 将 一 种 
关系 作为 研究 重点 ;同时 往往 基于 领域 内 的 显 性 知识 ， 
并 没有 挖掘 出 受众 角度 的 深层 次 隐 性 知识 。 

目前 国内 外 数字 人 文 研究 均 处 于 文献 积累 阶段 ， 
司 内 研究 较 国 外 起 步 晚 , 且 成 果 量 与 国外 存在 一 定 差 
距 。 现 有 总 结 性 文献 在 研究 思路 上 ,将 共 现 网 络 与 引 
证 网 络 割 裂 开 来 ,没有 结合 考虑 两 种 关系 ;在 研究 方法 
上 ,当前 研究 仅仅 关注 创作 者 传递 出 的 显 性 信息 ,而 忽 
各 了 施 引 方 通过 阅读 提炼 得 到 的 引用 文本 里 的 潜在 信 
息 。 所 以 ,数字 人 文 领域 正 需 要 新 的 思路 与 方法 ,来 对 
历史 研究 脉络 进行 梳理 与 把 握 。 


3.1 数据 获取 与 定义 

本 研究 将 Web of Science 核心 合集 作为 主要 数据 
来 源 ,构建 3 个 文献 集 ( 即 中 心 文献 集 .参考 文献 集 . 引 
文 文本 集 ) ,通过 获取 全 文 来 建立 两 个 引文 文本 集 ( 即 
中 心 文献 的 引文 文本 集 . 施 引 文献 的 引文 文本 集 ) E 
获取 全 文 过 程 中 ,各 全 文 数 据 库 与 互联 网 搜索 引擎 提 
供 的 资源 也 同时 被 参考 ,以 确保 数据 完全 。 

中 心 文献 集 ,被 定义 为 以 "digital humanities” EX 
关键 词 进行 主题 字段 检索 所 获得 的 768 条 文献 数据 
(截止 时 间 2018 年 1 月 )。 施 引文 献 集 ,被 定义 为 中 心 
文献 对 应 的 1 100 条 施 引 文献 记录 ,可 以 通过 点 击 Web 
of Science 各 文献 的 被 引 记录 下 载 获取 。 人 参考 文献 集 ， 
被 定义 为 被 引 次 数 最 高 的 20 篇 中 心 文献 的 参考 文献 
HB, , 共 包 括 956 条 文献 记录 。 

在 获取 3 个 文献 集 后 ,分 别提 取 各 文献 所 原始 标 
注 的 关键 词 , 并 根据 各 集合 的 论文 记录 ,进一步 下 载 论 
文 全 文 。 

引文 文本 集 包 括 中 心 文献 的 引文 文本 集 ( 中 心 文 
献 引用 参考 文献 的 引文 文本 集 ) 和 施 引 文献 的 引文 文 
本 集 ( 施 引 文献 引用 中 心 文献 的 引文 文本 集 )。 研 究 
通过 参考 文献 列表 与 引用 标识 符 信息 ,提取 出 相关 文 
献 的 引文 上 下 文 文本 。 

3.2 引文 上 下 文 关键 词 的 识别 

引文 上 下 文 是 引文 内 容 分 析 的 基础 ,对 其 的 识别 
和 相关 应 用 已 成 为 研究 热点 。 在 A. Bader 对 引文 的 
研究 中 ,选取 了 不 同 长 度 的 引文 窗口 进行 测试 实验 :在 
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引用 标识 的 前 后 截取 共 10 个 单词 30 个 单词 50 个 单 
词 以 及 不 计 单 词 个 数 的 引用 名 (以 引用 标识 所 在 的 整 
名 作为 引用 句 ,通过 标点 符号 界定 ) 共 4 组 数据 ,结果 
证 明 ,引文 窗口 长 度 为 50 的 引文 上 下 文 最 能 代表 被 引 
CHR PIU, Ej S. Bradshaw" f Bo n sz £s 
果 相 印证 。 因 此 ,本 文选 取 包 含 引 用 标识 附近 50 个 单 
词 的 引文 上 下 文 文本 形成 资料 集 。 

具体 来 说 ,在 提取 引用 标识 附近 50 个 单词 作为 引 
文 文本 集 时 ,遵循 以 下 规则 :GD 考虑 文献 结构 ,引文 上 
下 文 的 截取 必须 在 同一 段落 内 。@) 一 个 引文 上 下 文 文 


络 ,可 以 了 解 科学 知识 的 传播 与 流动 ,发 现 其 中 的 传承 
发 展 或 转化 创新 关系 ,也 可 以 研究 领域 科学 知识 发 展 
的 脉络 和 结构 。 

关键 词 对 文献 主题 具有 更 直观 的 揭示 作用 ,是 文 
献 内 容 的 浓缩 。 借 鉴 上 述 方法 ,构建 关键 词 的 引用 关 
系 网 络 ,反映 论文 中 一 个 关键 词 构 建 的 文献 情景 对 另 
一 个 关键 词 构建 的 文献 情景 的 引用 。 本 文 将 其 定义 为 
基于 文献 引证 的 关键 词 网 络 ,简称 为 引证 关键 词 网 络 。 
具体 地 ,从 两 个 切入 点 来 对 数字 人 文 领域 进行 研 
究 : 一 是 构建 关键 词 共 现 网 络 ,以 了 解 知识 的 结构 ;二 


本 中 只 能 包含 一 个 引文 标识 。 当 一 个 引文 句 中 包含 多 
个 引用 标识 时 ,除了 引用 标识 同时 出 现 或 以 “and” 进行 
连接 两 种 情况 外 , 则 需要 缩短 引文 上 下 文 的 长 度 ,通过 
在 甸子 边界 断 句 来 实现 。@ 对 同一 文献 进行 多 次 引用 
时 < 则 保留 多 个 引文 上 下 文 文本 。 以 引用 标识 为 唯一 


怀 调 符 ,每 出 现 一 次 引用 标识 ,就 截取 一 个 引文 上 下 文 
3g 


加 在 提取 出 引文 上 下 文 文本 之 后 ,利用 下 述 方法 识 
IRER lia] 
@ 〇 首先 ,将 所 有 引文 上 下 文 文本 视 为 一 个 整体 ,进行 
LDA latent Dirichlet allocation) 主题 识别 。LDA 是 一 种 
文生 主题 生成 模型 ,也 称 为 3 层 贝 叶 斯 概率 模型 ,包含 
词 . 主 题 和 文档 3 层 结构 。 通 过 调用 Python 的 skleam 
模拟 , 设 定 忽略 在 50% 的 上 下 文 文档 语料库 中 都 出 现 
HP RD (max. df =0.5) ,识别 出 引文 窗口 前 10 个 
主题 ,以 及 每 个 主题 的 前 10 个 关键 词 ,以 了 解 引文 文 
本 的 主要 研究 主题 和 方向 。 其 次 ,将 所 有 引文 文本 视 
为 个 整体 ,对 所 有 引文 文本 进行 切 词 与 词 频 统计 , 利 
用 中 心 文献 集中 的 原 有 关键 词 构建 自 定义 词 表 , 通 过 
人 工 标注 的 方式 建立 停 用 词 表 和 同 义 蔡 换 词 表 。 根 据 
此 3 个 词 表 , 对 原 词 频 统 计 结果 进行 处 理 ,转化 为 词 的 
权重 表 ; 别 除 停 用 词 ;合并 同义词 ;提高 自 定义 词 权 重 
最 后 ,以 此 权重 词 表 为 依据 ,再 回 到 每 一 个 引文 文本 
中 ,至 多 提取 出 每 一 个 引文 文本 中 权重 最 高 的 5 个 词 ， 
成 为 引文 上 下 文 的 关键 词 。 
3.3 ”研究 方案 

知识 网 络 有 助 于 厘清 文献 间 的 关系 ,从 文献 中 提 
取信 息 和 知识 单元 ,进一步 了 解 知识 的 结构 和 演化 。 
现 有 的 词 的 共 现 网 络 研究 主要 反映 研究 主题 及 主题 间 
的 联系 ,以 了 解 当前 研究 的 热点 与 研究 类 群 关系 。 

现 有 科学 引证 网 络 大 多 是 以 文献 或 作者 为 节点 ， 
以 文献 之 间 的 引用 关系 作为 节点 之 间 的 联系 边 ,以 此 
构建 相关 引用 文献 之 间 的 引用 网 络 。 通 过 科学 引证 网 
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是 构建 基于 引证 的 引文 上 下 文 关键 词 网 络 与 引用 文献 
关键 词 网 络 , 以 了 解 知 识 的 脉络 。 

在 关键 词 共 现 网 络 中 ,通过 合并 关键 词 集 , 构 建 数 
字 人 文 核心 文献 关键 词 的 知识 吸收 网 络 和 知识 扩散 网 
络 。 合 并 ,是 指 在 保留 词 与 词 的 共 现 关 系 基础 上 ,对 不 
同 词 集中 的 相同 关键 词 进 行 连接 。 知 识 吸收 网 络 , 是 
合并 参考 文献 集 、 中 心 文献 的 引文 文本 集 和 中 心 文献 
集 的 关键 词 共 现 网 络 。 知 识 扩散 网 络 ,是 合并 中 心 文 
献 集 、 施 引文 献 的 引文 文本 集 和 施 引文 献 的 关键 词 共 
现 网 络 。 研 究 将 知识 的 动态 演变 转 为 了 静态 网 络 , 以 
此 对 数字 人 文 领域 核心 知识 的 吸收 与 扩散 进行 分 析 。 

在 基于 引证 的 关键 词 网 络 中 , 则 考虑 了 中 心 文献 
和 施 引 文献 的 关系 、 高 被 引 中 心 文献 与 参考 文献 的 引 
用 关系 。 在 中 心 文献 集 与 施 引 文献 集 的 引用 关系 中 ， 
被 引 关键 词 是 中 心 文献 集 文献 原 有 关键 词 , 施 引 关键 
词 是 施 引 文献 引用 中 心 文献 的 引文 文本 关键 词 ; 在 高 
被 引 中 心 文献 集 与 参考 文献 集 的 引用 关系 中 ,被 引 关 
键 词 是 参考 文献 集 文献 原 有 关键 词 , 施 引 关键 词 是 中 
心 文献 引用 参考 文献 的 引文 文本 关键 词 。 
基于 引用 关系 ,把 被 引 关键 词 . 施 引 关键 词 作为 网 
络 的 节点 ,引用 关系 作为 边 ,构建 关键 词 引用 网 络 。 从 
中 心 文献 与 施 引 文献 的 关系 中 ,可 以 发 现 数 字 人 文 研 
究 的 发 展 与 转化 趋势 ;从 中 心 文献 与 参考 文献 的 关系 
中 ,可 以 发 现 数字 人 文 研究 的 来 源 与 形成 ;通过 对 其 来 
源 与 去 向 进行 综合 分 析 , 可 以 综合 了 解数 字 人 文 的 “前 
ESE” ,厘清 数字 人 文 发 展 的 整个 知识 脉络 。 


uu 


4.1 知识 吸收 网 络 

中 心 文献 集中 的 关键 词 代表 了 当前 数字 人 文 领域 
中 的 核心 知识 ,可 以 认为 这 些 知识 来 源 于 对 参考 文献 
集中 核心 知识 的 引用 转化 。 基 于 此 ,将 参考 文献 集 .中 
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心 文献 引文 文本 集 和 中 心 文献 集 的 关键 词 以 共 现 关系 
进行 合并 ,可 以 综合 观察 数字 人 文 核心 文献 关键 词 的 
知识 吸收 过 程 和 结果 。 
1 是 合并 后 的 关键 词 共 现 网 络 , 共 有 2 968 个 不 
同 的 关键 词 ,构成 了 共计 13 069 对 共 现 关系 对 。 从 图 
1 中 可 以 看 到 ,数字 人 文 知 识 的 吸收 与 形成 中 , 朝 两 团 
复核 心 关 键 词 聚拢 ,边缘 游离 着 部 分 独立 的 小 网 络 。 


1 知识 吸收 的 合并 网 络 概览 


〇 知识 吸收 的 合并 网 络 的 bh 强度 为 48 , 即 在 网 络 中 

DH 48 条 联系 的 强度 不 低 于 48。 进 一 步 ,通过 强 
BEBE — REA , (E EE 2 所 示 的 数字 人 文 核心 文 
E 即 在 图 2 中 , 包 
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天 EF 整体 网 中 联系 强度 不 低 于 48 的 联系 ,以 及 这 些 联 
系 厦 连 接 的 节点 。 
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的 小 网 络 。 在 核心 网 络 中 ,数字 人 文 概念 与 人 文学 科 、 
教育 学 数字 史学 等 学 科 关联 性 最 强 , 表 明 这 几 类 学 科 
是 数字 人 文 关键 知识 吸收 过 程 中 的 重要 学 科 ; 与 文本 
挖 所 数据 可 视 化 关联 数据 等 技术 路 线 关联 性 最 强 ， 
表明 这 几 类 技术 在 数字 人 文 关键 知识 吸收 过 程 中 产生 
的 影响 力 最 大 ; 除 此 之 外 ,与 人 文 计算 、GIS、 远 距离 阅 
读数 字 图 书馆 .社交 媒体 、 大 数据 等 概念 也 极 具 关联 
性 ,表明 这 些 概念 相关 知识 影响 着 数字 人 文 领域 知识 
的 吸收 与 形成 过 程 。 在 核心 网 络 边缘 ,有 两 个 小 分 支 ， 
一 个 是 Twitter 与 微 博 等 形成 的 社交 网 络 知识 结构 ; 另 
一 个 是 数字 化 与 文本 、 图 书馆 .创新 性 等 形成 的 过 程 性 
知识 结构 。 
除了 核心 网 络 , 还 存在 着 一 些 独 立 小 网 络 :中 文 
学 .艺术 .史学 .地 图 所 构成 的 小 网 络 ,反映 了 基于 地 图 
技术 对 文学 .艺术 等 进行 历史 研究 的 跨 学 科 性 ;@) 主 题 
模型 .主题 和 树 所 构成 的 小 网 络 ,反映 了 基于 树 的 主题 
模型 在 数字 人 文 领 域 前 期 是 相对 重要 的 一 项 技术 方 
法 ;@) 文 化 遗产 和 严肃 游戏 ,这 一 强 关系 在 整个 网 络 中 
具有 较 高 的 独立 性 ,是 数字 人 文 研 究 中 的 一 个 小 分 支 ， 
致力 于 基于 严肃 游戏 的 模式 展示 和 传播 文化 遗产 ;中 
期 刊 和 引用 的 关系 ,主要 是 基于 引用 数据 和 指标 对 期 
刊 进行 评价 。 
4.2 知识 扩散 网 络 
中 心 文献 集 的 核心 知识 在 传播 过 程 中 ,对 后 续 知 
识 的 形成 产生 了 影响 ,具有 知识 扩散 传播 的 过 程 。 基 
于 此 ,将 中 心 文献 集 、 施 引文 献 引 文 文本 集 和 施 引 文献 
集 的 关键 词 以 共 现 关系 进行 合并 ,可 以 综合 观察 数字 
人 文 核心 文献 关键 词 的 知识 扩散 过 程 和 结 
果 。 
图 3 是 合并 后 的 关键 词 共 现 网 络 , 共 有 
3 790 个 不 同 的 关键 词 ,构成 了 60 366 对 共 
现 关 系 对 。 从 图 3 中 可 以 看 到 ,数字 人 文 知 
识 的 扩散 与 传播 中 ,主要 是 以 一 个 关键 词 团 
簇 为 核心 进行 发 散 , 其 间 还 产生 了 一 些小 的 
知识 网 络 。 
知识 扩散 的 合并 网 络 的 h 强度 为 各, 即 
在 网 络 中 至 少 有 42 条 联系 的 强度 不 低 于 
42。 通 过 h 强度 精炼 这 一 网 络 ,得 到 如 图 4 
所 示 的 数字 人 文 核心 文献 关键 词 的 知识 吸 
收 网 络 的 h 子 网 。 即 在 图 4 中 ,包括 了 整体 


location 


图 2 数字 人 文 核心 文献 关键 词 的 知识 吸收 网 络 的 h 子 网 


从 图 2 中 可 以 看 到 ,主要 形成 了 一 个 以 数字 人 文 
概念 为 中 心 的 核心 网 络 , 其 余 有 一 些 独 立 概念 所 形成 


网 中 联系 强度 不 低 于 42 的 联系 ,以 及 这 些 
联系 所 连接 的 节点 。 
从 图 4 中 可 以 看 到 ,数字 人 文 核心 知识 在 扩散 中 ， 
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图 3 知识 扩散 合并 网 络 概览 


首先 ,比较 分 析 知 识 吸收 网 络 和 知识 扩散 网 络 的 
数量 特征 。 表 1 是 知识 吸收 网 络 和 知识 扩散 网 络 在 数 
量 特征 上 的 对 比 表 , 包 括 整个 网 络 特征 及 其 h 子 网 的 


SEE s 
R1 知识 吸收 和 知识 扩散 网 络 的 数量 特征 比较 
络 节 络 联 IE 和 网 
知识 吸收 2968 — 13069 0.003 48 54 0.034 
知识 扩散 — 3790 60366 0.008 42 45 0.051 


从 表 1 中 可 以 看 到 ,知识 扩散 网 络 的 整体 规模 大 
于 知识 吸收 网 络 , 包 括 整 体 网 络 的 节点 数 、 联 系数 和 网 
络 密度 。 这 表明 数字 人 文 知识 在 扩散 中 分 布 的 知识 点 
更 广泛 ,同时 知识 点 之 间 整 体 的 关联 性 更 强 。 在 上 T 


qhberinfyastnieture ool 网 中 ,知识 吸收 网 络 中 具有 高 联系 强 
embedded librarianship information eng: 

PS MGR TER data visyalization : " Ps RE 的 知 p: W 点 更 多 o 

co m M / PNH EF h 子 网 从 内 容 上 比较 知识 吸 

LO | 收 和 知识 扩散 的 核心 网 络 。 图 5 是 知 

© "i ng J e f£ $ 

e e ZZ | 识 吸收 网 络 和 知识 扩散 网 络 h 子 网 中 

\ AAA us is Og 

Pollen nar 的 节点 集合 图 。 从 图 5 可 以 看 到 ,两 

O Bett sad 个 集合 中 的 节点 具有 较 大 交集 。 这 些 

NIE iia 知识 是 数字 人 文 领域 知识 吸收 与 扩散 

e me ON Migne t "Us 过 程 中 的 关键 知识 ,除了 数字 人 文 概 

N | NENT oes 念 之 外 ,人 文 计算 .地理 信息 系统 相关 
academiglibraries archive 

2 Sici: 知识 与 数字 人 文 知 识 紧密 相关 。 除 此 

X 图 4 数字 人 文 核心 文献 关键 词 的 知识 扩散 网 络 的 h 子 网 还 有 图 书馆 类 知识 ,包括 数字 图 书馆 、 


主权 就 围绕 着 数字 人 文 的 概念 进行 ,整个 h 子 网 主要 
呈 军 心 发 散 状 。 在 其 中 ,图 书馆 类 知识 表现 特别 突出 ， 
如 坚 入 式 图 书馆 数字 图 书馆 .学术 图 书馆 、. 近 阅读 、 远 
距离 阅读 .开放 获取 等 概念 都 在 h 子 网 中 有 所 展示 ,这 
表明 基于 图 书馆 的 研究 在 当前 数字 人 文 领域 中 得 到 了 
较 多 关注 。 此 外 ,可 以 看 到 延伸 出 了 一 个 比较 小 的 网 
络 分 支 ,由 人 文学 科 数字 化 技术 .创新 性 数据 .工具 
和 信息 所 构成 ,表明 了 数字 人 文 和 人 文学 科 的 内 在 联 
系 。 在 社交 媒体 分 支 上 ,被 研究 最 多 的 平台 仍然 是 
Twitter ,此 外 ,新 产生 了 替代 计量 学 (altmetrics ) 这 一 概 
念 ,在 计量 学 领域 中 产生 了 影响 。 
4.3 知识 吸收 网 络 与 知识 扩散 网 络 比较 

将 参考 文献 集 、 中 心 文献 引文 文本 集 和 中 心 文献 
集 的 关键 词 以 共 现 关系 进行 合并 ,表征 数字 人 文 核心 
关键 词 的 知识 吸收 ;将 中 心 文献 集 . 施 引 文献 引文 文本 
集 和 施 引文 献 集 的 关键 词 以 共 现 关 系 进行 合并 ,表征 
数字 人 文 核心 关键 词 的 知识 扩散 。 
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档案 . 远 距 离 阅读 ;学 科 类 知识 ,包括 

史学 ,数字 史学 人 文学 科教 育 学 等 ;数据 数字 化 类 知 

识 , 包 括 数字 化 、 数 据 可 视 化 、 大 数据 等 ;还 有 文化 遗 

产 、Twitter 等 社交 媒体 是 关注 的 研究 对 象 。 在 其 中 ,有 

关 本 体 、 关 联 数据 、 语 料 库 语言 学 、 文 本 挖掘 等 相关 技 
术 是 数字 人 文 领域 中 的 重点 技术 。 

不 同 的 是 ,在 数字 人 文 领域 知识 吸收 中 ,更 关注 地 

图 技术 、 基 于 树 的 主题 模型 \ 隐 性 信息 等 ;而 在 数字 人 

文 领域 知识 扩散 中 ,更 关注 信息 基础 设置 .信息 素养 、 

衣 人 式 图 书馆 、 蔡 代 计量 学 ` 开 放 获取 、 近 距离 阅读 、 持 


5 基于 引文 上 下 文 的 数字 人 文 知识 引证 


关键 词 网 络 
5.1. 高 被 引 中 心 文献 与 参考 文献 的 引证 关键 词 网 络 


在 中 心 文献 对 参考 文献 进行 引用 的 过 程 中 ,构成 
了 引文 文本 关键 词 对 参考 文献 原 关 键 词 的 引用 关系 ， 
即 若 中 心 文献 A 引用 了 参考 文献 B( 原 关键 词 :bl b2, 
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书 情报 工作 ,2019 ,63 (7) :86 - 95. 
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图 6 高 被 引 中 心 文献 与 参考 文献 间 的 关键 词 引 用 网 络 核心 


可 以 从 图 6 中 看 到 ,Twitter topic model humanities 方法 上 ,主题 识别 是 研究 过 程 中 的 重要 手段 ;在 载体 
以 及 digital 是 网 络 中 的 核心 节点 ,表明 这 几 类 是 数字 ”上 ,Twitter 是 国外 数字 人 文 研究 的 重要 平台 。 
人 文 高 被 引 知识 形成 过 程 中 的 重要 信息 。 即 在 方向 在 人 文学 科 与 数字 化 研究 的 类 群 中 ,可 以 看 到 数 
上 , 仍 沿 着 数字 人 文 的 路 径 对 人 文学 科 进 行 数字 化 ;在 。” 字 图 书馆 社区、 计算 机 档案 、GIS、 期 刊 等 都 是 数字 人 
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文 前 期 的 重点 研究 对 象 。 在 主题 识别 的 类 群 中 ,可 以 
看 到 有 关 结 构 “ 树 ”的 算法 等 是 研究 方法 中 的 关注 
点 。 在 Twitter 的 类 群 中 ,可 以 看 到 有 关 用 户 、 工 具 


表 2 关系 强度 大 于 30 的 引用 词 对 


社交 等 信息 ,表征 着 数字 人 文 对 社交 平台 研究 的 关 
注 ;可 以 明显 看 到 digital humanities 对 humanities com- 
puting 的 引用 ,人 文 计算 作为 数字 人 文 的 前 身 ,对 数 
字 人 文 的 前 期 发 展 具有 重要 影响 ,以 及 历史 、 文 学 两 
个 传统 学 科 类 别 从 一 开始 就 是 数字 人 文 研究 的 重点 
学 科 领 域 。 

除 此 之 外 ,参考 文献 集 的 关键 词 补充 了 引文 文本 
关键 词 后 ,可 以 揭示 一 些 潜在 的 论文 细节 。 例 如 Twit- 
ter 和 topic model 是 参考 文献 的 关键 词 ,在 加 入 引文 文 
本 关键 词 后 ,可 以 看 到 其 隐藏 的 路 径 关 联 user, 还 可 以 
看 到 与 之 连接 的 retweeting ,进而 对 研究 细节 进一步 验 
证 全 对 于 社交 平台 的 数字 人 文 研究 往往 以 用 户 为 桥 


| 
梁 y 主 要 分 为 两 派 : 一 是 对 内 容 进行 主题 分 析 ; 二 是 对 


转 恬 行为 进行 关系 研究 。 这 是 书目 关键 词 网 络 难以 挖 
手机 技术 细节 。 

六 -基于 引文 文本 ,将 高 被 引 中 心 文献 的 施 引 情况 以 
关 硅 词 粒度 进行 可 视 化 ,可 以 探索 出 高 被 引 中 心 文献 
0 识 的 形成 过 程 ,了 解数 字 人 文 核心 知识 的 来 源 , 有 
利 沁 从 根源 上 了 解数 字 人 文 ,从 而 更 好 地 把 握 数 字 人 
区 的 未 来 发 展 。 
2? 中 心 文献 与 施 引文 献 的 引证 关键 词 网 络 

本 研究 从 中 心 文献 中 共 提 取出 1 220 个 关键 词 ， 
实际 是 由 757 个 词 /词组 所 组 成 ;从 施 引文 本 关键 词 中 
共 提 取出 了 1 220 个 关键 词 ,实际 是 由 383 个 词 /词组 
BER, JERE 113 个 词 /词组 也 属于 被 引文 献 关键 
词 。 被 引 词 和 施 引 词 之 间 共 产生 了 5 508 对 引用 关系 
对 。 


首先 ,从 被 引 词 和 施 引 词 的 实际 词 数组 成 可 以 看 
到 ,主要 知识 点 从 757 个 词 /词组 传递 到 383 个 词 / 词 
组 ,知识 在 引用 过 程 中 变 得 更 集聚 ,领域 研究 关注 点 更 
加 突出 。 表 2 是 关系 强度 大 于 30 的 引用 关系 对 ,共有 
15 组 。 

在 表 2 中 的 被 引 词 方面 ,digital humanities 出 现 的 
频数 相对 较 高 ,这 说 明 在 显 性 信息 中 ,明确 围绕 数字 人 
文 概念 进行 的 研究 能 更 多 地 引起 学 者 们 的 共鸣 ,一 方 
面 关 注 数 据 数字 化 深化 ,包括 其 中 的 技术 手段 ; 男 一 
方面 关注 其 研究 内 容 , 包 括 历史 学 研究 或 发 展 历史 的 
研究 。 在 表 2 中 的 施 引 词 方面 ,Twitter 出 现 的 频数 是 
最 高 的 ,这 表明 从 受众 角度 ,数字 人 文 领域 已 有 研究 传 
递 出 较 多 关于 Twitter 的 有 价值 的 信息 。 
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排名 ash 施 引 词 2A ma 
强度 5| 
l digital humanities data 70 
2 Twitter Twitter 62 v 
3 digital humanities digital humanities 54 v 
4  altmetrics Twitter 47 
5 disciplinary differences Twitter 47 
6 scholarly communication Twitter 47 
7  webometrics Twitter 47 
8 digital humanities digital 46 
9 digital humanities history 42 
10 social networks Twitter 39 
11 humanities digital humanities 36 
12 conferences Twitter 36 
13 digital communication systems Twitter 36 
14 user studies Twitter 36 
15 digital humanities technology 33 


在 隐 性 信息 中 ,Twitter 的 高 显示 度 表 明了 研究 中 对 
社交 媒体 这 一 对 象 的 关注 在 不 断 提升 ,包括 蔡 代 计量 
学 \ 网 络 计量 学 等 一 系列 由 互联 网 进步 所 兴起 的 新 兴 计 
量 指标 ,表明 了 数字 人 文 研 究 在 互联 网 领域 的 关注 。 

在 引用 过 程 中 ,还 可 以 看 到 领域 内 对 学 科 差异 性 、 
学 术 交 流 的 重视 。 数 字 人 文 是 一 门 交 叉 学 科 , 整 合 学 
科 差 异 .探索 有 效 的 路 学 科 交 流 合作 模式 能 够 有 力 推 
动 数字 人 文 的 学 术 研 究 进展 。 

此 外 ,用 户 研 究 数字 通讯 系统 、 社 会 网 络 .相关 会 
议 等 主题 方向 也 得 了 学 者 们 较 多 的 关注 。 

在 引用 关系 词 对 中 ,有 一 部 分 引用 关系 的 被 引 词 
和 施 引 词 是 同一 个 词 / 词 组 ,表明 这 些 词 所 代表 的 知识 
更 多 的 是 继承 与 深化 , 表 2 中 就 有 部 分 关系 词 对 是 同 
词 引 用 。 在 5 508 对 引用 关系 对 中 ,有 61 对 引用 关系 
是 同 词 引 用 。 虽 然 在 5 508 对 关系 对 中 所 占 比 例 并 不 
大 ,但 从 施 引 词 的 实际 个 数 来 看 ,384 个 引用 词 中 有 61 
个 词 是 同 词 引 用 。 表 明 在 引用 过 程 中 ,至 少 有 约 16% 
的 知识 保持 着 同 词 传播 与 传承 。 表 3 是 关系 强度 排名 
前 10 的 同 词 引用 关系 对 ,关系 强度 最 高 的 两 对 关系 分 
别 是 词 Twitter 和 digital humanities。 这 表明 在 宏观 层 
面 上 , 围绕 数字 人 文 这 一 概念 进行 研究 的 知识 多 数 也 
会 以 这 一 概念 继续 传播 ;在 微观 层面 上 ,针对 Twitter 
这 一 社交 媒体 进行 的 研究 在 被 引用 过 程 中 ,也 会 将 
Twitter 作为 一 个 特殊 的 研究 对 象 进行 传播 。 

其 他 高 频 同 引 关系 对 包括 :新 闻 学 、 计 算 新 闻 学 、 
档案 、 期 刊 等 媒体 相关 的 对 象 ,技术 、 地 理 信息 系统 、 数 
据 等 技术 相关 的 对 象 ,学 术 交 流 .引用 等 行为 相关 的 对 
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表 3 同 词 引用 的 关系 对 top10 


地 位 。 网 络 中 一 个 节点 的 点 度 中 心 度 , 可 以 用 网 络 中 


排名 被 引 词 施 引 词 

强度 
1 Twitter Twitter 62 
2 digital humanities digital humanities 54 
3 journalism journalism 21 
4 computational journalism computational journalism 19 
5 technology technology 16 
6 — scholarly communication scholarly communication 15 
7 archive archive 12 
8 journal journal 11 
9 data data 10 
10 citation citation 9 
10 GIS GIS 9 


象 ,在 进行 知识 传播 时 ,上 述 关 键 词 是 中 心 文献 与 施 引 
文献 间 继承 与 深化 的 主动 脉 。 

本 下 文 基于 被 引 词 与 施 引 词 之 间 的 引用 关系 ,构建 数 
学 天文 研究 领域 的 引用 网 络 。 图 7 是 引文 文本 关键 词 


与 驯 应 被 引文 献 关键 词 所 构建 的 引文 网 络 ,图 中 词 节 点 
JB deii BE i this ARE 


/:202307.0 
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图 7 数字 人 文 研究 领域 引用 网 络 


从 引用 网 络 的 图 7 中 ,能 看 到 知 
识 信息 主要 是 从 中 心 关键 节点 向 外 发 
散 传播 。 中 心 节 点 间 联 系 密切 ,反映 
了 数字 人 文 研究 的 热点 之 间 知 识 结构 
较 融 合 ;外 围 节 点 间 主 要 是 “各 成 一 
UR” ,反映 了 数字 人 文 在 跨 学 科研 究 
的 背景 下 ,研究 方向 具有 差异 性 ,许多 


news instifytionalism 


cuige 


jourmgiism 
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与 该 点 有 直接 联系 的 点 的 数目 来 衡量 。 在 该 数字 人 文 
研究 领域 的 引用 网 络 中 ,节点 之 间 的 平均 度 为 3.2, 表 
明 每 一 个 词 节点 平均 与 其 它 3 个 词 节 点 之 间 具 有 引用 
关系 ;节点 之 间 的 平均 加 权 度 为 7.2, 表 明 每 一 个 节点 
平均 与 其 他 节点 具有 共 7 次 引用 联系 。 

接 下 来 通过 限制 网 络 中 联系 边 的 权重 冰 值 来 探索 
数字 人 文 研 究 领域 的 核心 引用 网 络 。 图 8 是 通过 限制 
节点 间 联 系 权重 值 不 低 于 20 所 形成 的 引用 网 络 ,形成 
了 两 篮 独立 的 引用 网 络 ,箭头 由 施 引 词 指 向 被 引 词 。 

在 左边 的 引用 网 络 中 ,关键 节点 是 journalism ( 新 
闻 ) 和 digital humanities( 数 字 人 文 ) ,连接 了 两 边 的 引 
用 网 络 。 在 journalism 节点 上 ,主要 是 其 对 其 它 知识 的 
引用 ,表明 在 当前 的 研究 中 ,新 闻 学 方面 的 研究 是 一 大 
热点 ,并 且 其 综合 了 数据 技术 、 文 化 ,在 计算 新 闻 、 新 
制度 主义 、 民 族 志 、 政 治 经 济 、 新 闻 社 会 学 等 方面 进行 
了 深入 的 研究 。 在 digital humanities 节点 上 ,主要 是 其 
它 知 识 对 其 的 引用 ,表明 当前 不 少 研究 围绕 并 明确 数 
字 人 文 的 概念 进行 探索 ,包括 继续 在 数据 信息 、 数 字 
化 \ 可 视 化 技术、 史学 等 研究 方向 上 进行 深化 。 

在 右边 的 网 络 中 ,相关 研究 主要 围绕 Twitter 这 一 
主题 进行 ,并 且 主 要 是 由 Twitter 从 其 他 关键 词 方向 获 
取信 息 进行 整合 研究 ,主要 包括 社交 网 络 ,用户 研究 、 
替代 计量 学 ` 网 络 计量 学 .数字 通信 系统 会议 等 。 而 
学 科 差 异 方向 的 研究 会 从 Twitter 研究 中 引用 知识 , 认 
为 其 作为 网 络 社交 平台 的 代表 ,在 探索 新 的 学 术 交 流 
方式 .新 的 计量 手段 上 具有 重要 的 参照 价值 。 

在 有 向 网 络 中 ,从 某 个 节点 发 出 的 定向 连接 的 数 
量 称 为 该 接点 的 出 度 ,指向 该 节点 也 终止 于 该 节点 的 
连接 的 数量 称 为 该 节点 的 人 度 。 在 数字 人 文 研究 的 引 
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节点 的 中 心 度 能 反映 节点 在 网 络 
中 所 处 的 地 位 及 权利 影响 ,中 心 度 高 
的 在 节点 中 处 于 核心 地 位 ,影响 力 大 ; 
反之 ,中 心 度 低 的 在 节点 中 处 于 边缘 
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8 数字 人 文 研究 领域 核心 引用 网 络 
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用 网 络 中 ,节点 的 人 度 表示 被 引 关 键 词 在 被 引用 过 程 
中 的 热度 ,也 代表 了 数字 人 文 研究 传播 出 的 主要 知识 ; 
节点 的 出 度 表示 在 施 引 过 程 中 学 者 们 的 关注 点 。 表 4 
是 引用 网 络 中 人 度 最 高 的 10 个 关键 词 和 出 度 最 高 的 
10 个 关键 词 。 

表 4 引用 网 络 节点 中 心 度 


排名 0 tid E | 排名 EE ME 
(被 引 ) ( 施 引 ) 
l digital humanities 292 1 data 202 
2 humanities 70 2 digital 167 
3 history 50 3 digital humanities 163 
4 archives 47 4 application 99 
5 text mining 35 5 difference 96 
6 academic libraries 32 6 technology 84 
* digital history 30 7 information 84 
> technology 27 8 new 82 
ocial media 27 9 field 81 
à digital libraries 26 10 history 76 


己 从 节点 入 度 排 名 可 以 看 出 ,数字 人 文 的 概念 、 史 学 
和 数字 史学 、 图 书馆 和 档案 .技术 (包括 文本 挖掘) 是 
傣 搜 最 广 的 知识 要 素 ,是 学 者 们 当前 最 关注 的 数字 人 
区 大 究 领 域 的 研究 点 。 从 出 度 排名 可 以 看 出 ,在 引用 
过 得 中 ,学 者 们 同样 关注 数字 人 文 的 概念 .史学 与 技 
术 但 更 注重 数字 .数字 化 与 应 用 ,注重 新 的 方法 或 手 
拆 带 来 的 差异 性 。 以 上 对 知识 节点 出 人 度 的 测量 只 
堵 芒 了 节点 词 与 其 他 词 的 联系 个 数 ,测量 了 传播 的 广 
度 G 久 有 考虑 节点 词 之 间 本 身 联系 所 具有 的 权重 值 。 
在 网 建 的 引用 网 络 中 , 词 与 词 之 间 的 引用 关系 强度 代 
表 鱼 原 被 引文 献 关 键 词 在 被 引 过 程 中 ,引文 文本 关键 
词 对 其 引用 的 次 数 ,本 身 反映 了 施 引 过 程 中 的 词 间 紧 
密 程度 。 因 此 ,综合 词 节点 与 其 他 各 节点 之 间 的 联系 
及 权重 ,得 到 各 词 节 点 的 加 权 入 度 和 加 权 出 度 , 排 名 前 
10 的 词 节 点 如 表 5 所 示 : 

表 5 引用 网 络 节 点 加 权 中 心 度 


s WAA TE 加 权 出 度 
排名 关键 词 (被 引 ) 排名 关键 词 ( 施 引 ) 
1 digital humanities 1 091 1 data 648 
2 humanities 278 2 Twitter 472 
3 Twitter 169 3 digital humanities 467 
4 technology 142 4 digital 422 
5 scholarly communication 131 5 technology 330 
6 culture 128 6 history 259 
7  altmetrics 120 7 visualize 226 
8 disciplinary differences 120 8 difference 224 
9  webometrics 120 9 information 218 
10 data 114 10 journalism 210 


加 入 权重 之 后 ,更 能 反映 出 被 引文 献 关 键 词 传播 
的 深度 。 从 表 5 可 以 看 到 ,文化 数据 、Twitter 等 对 象 
的 研究 得 以 传承 深化 ;而 蔡 代 计量 学 网络 计量 学 等 基 
于 互联 网 的 新 兴 词汇 虽然 在 连接 节点 的 广度 上 并 不 帘 
出 ,但 其 加 权 和 人 度 值 较 高 ,可 以 看 到 其 在 数字 人 文 研究 
领域 具有 小 范围 的 次 度 传播 。 同 时 ,学 科 的 学 术 交 流 
与 学 科 差 异 也 受到 了 学 者 们 的 重视 。 在 加 权 出 度 方 
面 ,新 增 了 对 新 闻 、 可 视 化 两 方面 研究 的 关注 。 


本 文 基于 共 现 网 络 与 引证 关键 词 网 络 的 方法 ,从 
知识 受众 的 角度 ,建立 了 数字 人 文 研究 领域 的 新 型 知 
识 图 谱 。 在 方法 层面 上 ,从 引文 上 下 文 文本 的 特殊 性 
出 发 ,通过 提取 引文 上 下 文 并 进行 关键 词 识别 ,构建 了 
引文 文本 关键 词 的 共 现 网 络 。 在 此 基础 上 ,将 引文 文 
本 关键 词 与 被 引文 献 的 关键 词 进行 连接 ,构建 出 新 型 
引用 网 络 ,反映 出 知识 与 关注 点 在 引用 过 程 中 的 流动 。 
在 领域 层面 上 ,数字 人 文 经 过 前 期 数 年 的 知识 积累 ,在 
近 几 年 获得 了 广泛 的 关注 。 作 为 一 种 革命 性 的 研究 思 
想 和 有 效 的 数字 化 工具 ,数字 人 文 深入 到 各 人 文艺 
AR .社会 科学 以 及 地 理 、 医 学 等 众多 学 科 方 向 ,积累 了 
较 丰 富 的 文献 。 对 其 领域 发 展 进行 梳理 与 总 结 ,深入 
分 析 数 字 人 文 研究 的 热点 ,明确 数字 人 文 研究 的 演化 
路 径 和 发 展 趋 势 , 有 利于 了 解数 字 人 文 研究 的 当前 进 
展 ,为 数字 人 文 领域 未 来 研究 提供 借鉴 和 参考 ,加 快 实 
参考 文献 : 

[ 1 ] RRR, 王 兰 成 . 知识 图 谱 的 概念 辨析 与 学 科 定 位 研究 [可 . 

图 书 情报 工作 , 2015,59(15) :5 - 11. 

[ 2 ] 李 启 虎 , 尹 力 , 张 全 . 信息 时 代 的 人 文 计算 [J]. 科学 ,2015 ,67 

(1) :35 -39 ,4. 

L3] 陈 悦 , 刘 则 渊 ， 悄 然 兴 起 的 科学 知识 图 谱 [ 了 . 科学 学 研究 ， 

2005 , 23(2) :149 - 154. 

[4 ] 张 斌 , 马 费 成 . 科学 知识 网 络 中 的 链 路 预测 研究 述评 [J]. 中 国 

图 书馆 学 报 ,2015 ,41(3 ) :99 - 113. 

[5 ] 郑 彦 宁 , 许 晓 阳 , 刘 志 辉 . 基于 关键 词 共 现 的 研究 前 沿 识别 方法 

研究 [中 .图 书 情报 工作 ,2016 ,60(4) :1 -8. 

[6] 吴 晓 秋 , 吕 娜 ， 基 于 关键 词 共 现 频率 的 热点 分 析 方法 研究 

[J]. 情报 理论 与 实践 , 2012 ,35(8) :115 - 119. 

[ 7 ] RHE, 武夷 山 . 作者 文献 耦合 分 析 与 作者 关键 词 耦合 分 析 比 
较 研 究 :Scientometrics SCIE4)HDr LJ]. 中国 图 书馆 学 报 , 2014， 
40(1) :25 -38. 

[ 8 ] 张 玲玲 , KER, 杜 丽 . 国家 社 科 基金 项 目 成 果 视 角 下 图 情 领 
域 知识 扩散 研究 [J]. 图 书馆 工作 与 研究 , 2017,1(10) :60 - 
66. 


HE, KiE, WEI. 数字 人 文 研究 领域 的 知识 图 谱 构 建 与 分 析 一 一 基于 WoS 文献 关键 词 和 夫妇 
书 情报 工作 ,2019 ,63(7 ) :86 - 95. 


[9] 罗 双 玲 , JKXGE, ELO. 基于 半 积 累 引文 网 络 社区 发 现 的 学 a literary GIS[ J]. Transactions of the institute of british geogra- 
科 领 域 主题 演化 分 析 一 一 以 "合作 演化 "领域 为 例 [J]. 情报 phers , 2015 ,36(1) :89 - 108. 
学 报 , 2017 ,36 (1) :100 - 110. [19] HINRICHS U, FORLINI S, MOYNIHAN B. Speculative prac- 
[10] 刘洋 , 崔 雷 . 引文 上 下 文 在 文献 内 容 分 析 中 的 信息 价值 研究 tices; utilizing InfoVis to explore untapped literary collections[ J]. 
[J]. 图 书 情报 工作 , 2014,58 (6) :101 — 104. IEEE transactions on visualization & computer graphics, 2016,22 
[11] LIU Y, RAFOLS I, ROUSSEAU R. A framework for knowledge (1) :429 - 438. 
integration and diffusion[ J]. Journal of documentation, 2012,68 [20] WONG S H R. Digital humanities; what can libraries offer? [J]. 
(1) :31 - 44. Portal; libraries and the academy , 2016 ,16(4) : 669 — 690. 
[12] BORNMANN L, HAUNSCHILD R, HUG S E. Visualizing the [21] 柯 平 , FE. 数字 人 文 研究 演化 路 径 与 热点 领域 分 析 [J]. 中 
context of citations referencing papers published by Eugene Garf- 国 图 书馆 学 报 , 2016 ,42(6) :13 -30. 
ield; a new type of keyword co-occurrence analysis[ J]. Sciento- [22] 高 胜 寒 , 赵 宇 翔 , 朱 庆 华 . 国内 外 数字 人 文 领 域 研究 进展 分 析 
metrics, 2018 ,114(2 ) :427 - 437. [J]. 图 书馆 杂志 ,2016,35(10) :9 - 18. 
[13] CHEN C. CiteSpace II; Detecting and visualizing emerging trends [23] WANG Q. Distribution features and intellectual structures of digital 
and transient patterns in scientific literature[ J]. Journal of the A- humanities; a bibliometric analysis[ J]. Journal of documentation , 
merican Society for Information Science and Technology, 2006 ,57 2018,74 (1) :223 -246. 


(3) :359 -377. [24] ALJABER B, STOKES N, BAILEY J, et al. Document clustering 


"BH, 陈 嘉 勇 , 李 国 俊 . 基于 CiteSpace 研究 科学 知识 图 谱 的 可 of scientific texts using citation contexts[ J]. Information retrieval , 
见 化 分 析 [J]. 图 书 情报 工作 , 2011,55(6) :91 - 95. 2010,13(2) :101 - 131. 

[15d wc. BÆR, HI. 基于 知识 图 谱 的 领域 新 兴 主 题 研 究 现 [25] BRADSHAW S. Reference directed indexing; redeeming relevance 
tA PCI]. 情报 杂志 , 2013(9) :88 94. for subject search in citation indexes [ M ]// Research and ad- 
HELPS C, HEIDL R, WADHWA A. Knowledge, networks, and vanced technology for digital libraries. Berlin; Springer, 2003 :499 


"knowledge networks; a review and research agenda[J]. Journal of —510. 

anagement ,2012 , 38(4) :1115 —1166. 作者 贡献 说 明 : 

*]iSCHREIBMAN S, SIEMENS R, UNSWORTH J. A companion to Y: f 责 论 xi 

igital humanities[ M]. New Jersey: John Wiley & Sons , 2008 :20 
-39. 


选 题 研究 方案 设计 ; 
陈 路 过 :负责 论文 资料 收集 、 数 据 分 析 和 初稿 撰写 ; 
杨佳 颖 :负责 后 续 修改 ,形成 定稿 。 


Knowledge Network in the Digital Humanities Domain 
—— Based on the Analysis of Keywords and Citation Contexts in WoS 
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Abstract. [ Purpose/significance] Citation shows the link between citing articles and cited ones, which reflects the 
reference and affirmation of successors. Derived from the traditional keyword network, this paper has innovated keyword 
network based on citation context. The constructed knowledge map can not only reveal the deep information of the litera- 
ture, but also reflect the knowledge-based process by which the readers actively select and utilize the literature. | Meth- 
od/process] In this paper, digital humanity was established as the research field. Three literature sets and two citation 
text sets were collected to build two non-direction keyword -sharing networks and two directed keyword networks based on 
citation. The co-occurrence network showed the absorption and diffusion of the knowledge of digital humanities while the 
citation keyword network illustrated the formation and transformation of digital humanities. | Result/conclusion | After vi- 
sualization of the constructed network , the research obtained core domain and core technology of digital humanities, which 
provided reference for the future research of digital humanities from the perspective of information recipients. 
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